🎯 Cel Analizy: Celem niniejszego badania jest zidentyfikowanie oraz ocena siły oddziaływania kluczowych determinant cenowych na rynku nieruchomości mieszkalnych w Polsce. Analiza koncentruje się na wielowymiarowym badaniu zależności między cechami fizycznymi lokalu, infrastrukturą otoczenia a ceną transakcyjną. Projekt zakłada dwuetapową weryfikację hipotez: w ujęciu globalnym (dla całego zbioru danych) oraz w ujęciu lokalnym, poprzez szczegółową analizę specyfiki wybranych rynków miejskich (np. Warszawy,Gdańska), co pozwoli na uchwycenie niuansów lokalizacyjnych wpływających na wycenę.
Analiza została przeprowadzona na zbiorze danych zawierającym oferty sprzedaży mieszkań z czerwca 2024 roku.
Źródło danych: [https://www.kaggle.com/datasets/krzysztofjamroz/apartment-prices-in-poland/?select=apartments_pl_2023_08.csv]
Poniższa tabela przedstawia opis zmiennych dostępnych w analizowanym zbiorze danych:
| Nazwa Zmiennej | Opis |
|---|---|
| id | Unikalny identyfikator ogłoszenia |
| city | Miasto, w którym znajduje się nieruchomość |
| price | Cena ofertowa (PLN) |
| squareMeters | Powierzchnia mieszkania w m² |
| rooms | Liczba pokoi |
| floor / floorCount | Piętro mieszkania / Liczba pięter |
| buildYear | Rok budowy budynku |
| type | Rodzaj zabudowy |
| ownership | Forma własności |
| lat / lon | Współrzędne geograficzne |
| centreDistance | Odległość od centrum (km) |
| poiCount | Liczba punktów POI (500m) |
| *Distance | Odległości do: szkół, przychodni itp. |
| has*Parking, Balkon, Winda, Ochrona… | Czy ma dane udogodnienie (TAK/NIE) |
Proces przygotowania danych do analizy został podzielony na kilka kluczowych etapów: definicję reguł poprawności, wstępną walidację, imputację braków danych (metodami statystycznymi i uczenia maszynowego) oraz weryfikację końcową.
Przed przystąpieniem do czyszczenia zdefiniowano zestaw reguł logicznych przy użyciu pakietu validate. Pozwoliło to na identyfikację błędów w surowym zbiorze danych.
Sprawdzono m.in.:
Spójność logiczną: Czy piętro mieszkania nie jest wyższe niż liczba pięter w budynku (Logic_Floor).
Zasady budowlane: Czy w budynkach jednopiętrowych nie zadeklarowano windy (Logic_Elevator).
Wiarygodność cen: Czy cena mieści się w przedziale 100 tys. – 10 mln PLN.
Geolokalizację: Czy współrzędne geograficzne znajdują się w granicach Polski (Bounding Box).
Kompletność dystansów: Czy odległości do punktów POI są wartościami dodatnimi.
Wstępna walidacja wykazała naruszenia, które zostały skorygowane w kolejnych krokach.
Wdrożono wieloetapowy potok przetwarzania danych (pipeline), obejmujący:
Wykluczenie zmiennych buildingMaterial oraz condition. Decyzja ta została podyktowana znacznym stopniem niekompletności danych (brakujące wartości) oraz niską jakością informacji źródłowych, co uniemożliwiało przeprowadzenie rzetelnej analizy statystycznej w tym zakresie.
Imputacja logiczna:
Braki w liczbie pięter (floor) uzupełniono wartością mediany (3) lub wartością floorCount, jeśli była mniejsza niż 3.
Informację o windzie (hasElevator) wywnioskowano na podstawie wysokości budynku (przyjęto, że budynki powyżej 4 pięter posiadają windę).
Imputacja statystyczna (Dystanse): Brakujące odległości do punktów usługowych (*Distance) uzupełniono średnią arytmetyczną obliczoną lokalnie dla każdego miasta.
Imputacja algorytmiczna (kNN): Brakujący rok budowy (buildYear) uzupełniono metodą k-Najbliższych Sąsiadów (kNN), bazując na podobieństwie pod względem liczby punktów POI oraz odległości od centrum.
Do uzupełnienia braków w kluczowej zmiennej kategorycznej type (rodzaj zabudowy) zastosowano model uczenia maszynowego Random Forest (las losowy). Model został wytrenowany na kompletnych obserwacjach (500 drzew decyzyjnych), a następnie wykorzystany do predykcji typu budynku dla brakujących rekordów, co pozwoliło na zachowanie struktury danych lepiej niż proste uzupełnienie dominantą.
Po zakończeniu procesu czyszczenia przeprowadzono:
Ponowną walidację: Sprawdzono zgodność danych z regułami validate.
Analizę braków (naniar): Potwierdzono wyeliminowanie kluczowych braków danych.
Zapis: Przetworzony zbiór danych został zapisany do pliku .RData w celu optymalizacji wydajności raportu.
Rozdział ten stanowi szczegółową analizę zebranych danych, mającą na celu zrozumienie mechanizmów rządzących polskim rynkiem nieruchomości w 2026 roku. Przeprowadzona analiza opisowa pozwala zidentyfikować kluczowe trendy cenowe oraz zrozumieć, jakie czynniki techniczne i lokalizacyjne w największym stopniu kształtują wartość ofert. Dzięki wykorzystaniu miar tendencji centralnej oraz metod wizualizacji, możliwe jest oddzielenie typowych transakcji od zjawisk o charakterze luksusowym czy marginalnym. Stanowi to fundament do dalszych, bardziej zaawansowanych wniosków dotyczących opłacalności inwestycji w konkretnych segmentach rynku.
Rozkład cen cechuje się silną asymetrią prawostronną, z największą koncentracją ofert w przedziale od 500 000 do 850 000 PLN. Dominacja tego segmentu wyznacza rynkowy standard cenowy, podczas gdy oferty powyżej 1,5 mln PLN stanowią nieliczną grupę nieruchomości luksusowych. Wyraźny brak ogłoszeń poniżej 250 000 PLN definiuje wysoki próg wejścia na badany rynek. Obecność wartości odstających, sięgających nawet 3 mln PLN, powoduje, że średnia arytmetyczna jest zawyżona. W konsekwencji to mediana, a nie średnia, najlepiej oddaje realny koszt zakupu typowego mieszkania.
Wykres prezentuje wyraźną korelację dodatnią między liczbą pokoi a ceną nieruchomości, przy czym wraz ze wzrostem metrażu obserwuje się nie tylko wzrost mediany, ale także znaczące rozszerzenie rozstępu międzykwartylowego. Rynek mieszkań 1- i 2-pokojowych charakteryzuje się największą stabilnością i koncentracją cenową, gdzie niski próg wejścia oscyluje wokół 400 000 PLN, natomiast segmenty 3- i 4-pokojowe wykazują silną asymetrię prawostronną z licznymi wartościami odstającymi sięgającymi nawet 3 mln PLN. Obecność tak wysokich wartości ekstremalnych w segmencie średniej wielkości mieszkań świadczy o silnie rozwiniętym rynku premium, który istotnie zawyża średnią arytmetyczną, czyniąc medianę najbezpieczniejszym wskaźnikiem typowej ceny transakcyjnej. W przypadku największych lokali, mających 5 i 6 pokoi, korpusy wykresów stają się znacznie wyższe, co sugeruje, że w tej kategorii liczba pokoi przestaje być dominującym czynnikiem cenotwórczym na rzecz standardu wykończenia i prestiżowej lokalizacji. Całość obrazuje strukturę rynkową, w której ryzyko cenowe i dyspersja ofert rosną progresywnie wraz z wielkością nieruchomości, definiując rynek o wysokim stopniu zróżnicowania jakościowego.
Analiza wykresu skrzypcowego (violin plot) wskazuje na istotne różnice w strukturze cenowej w zależności od typu zabudowy, przy czym segment apartamentowców charakteryzuje się najwyższą medianą cen oraz najbardziej rozciągniętym prawostronnym ogonem rozkładu. W przeciwieństwie do bloków, które wykazują największą koncentrację ofert w węższym przedziale cenowym i relatywnie najniższy próg wejścia, kamienice prezentują specyficzny, dwumodalny charakter rozkładu sugerujący podział na lokale standardowe oraz nieruchomości zrewitalizowane o znacznie wyższej wartości. Największą gęstość prawdopodobieństwa dla wszystkich typów zabudowy obserwujemy w przedziale od 600 000 do 1 100 000 PLN, jednak to apartamentowce wykazują najszerszy rozstęp międzykwartylowy, co świadczy o największym zróżnicowaniu standardu w tej kategorii. Wyraźne wydłużenie „szyjek” wykresów w stronę wartości przekraczających 2 mln PLN, szczególnie widoczne w przypadku kamienic i apartamentowców, potwierdza występowanie silnej asymetrii dodatniej i unikalnych ofert luksusowych, które kształtują górną granicę badanego rynku. Całość zestawienia dowodzi, że o ile blokowiska stanowią najbardziej przewidywalny i jednorodny segment cenowy, o tyle inwestycja w apartamenty lub kamienice wiąże się z większą dyspersją kosztów i obecnością ofert o charakterze wybitnie prestiżowym.
Mapa punktowa ofert prezentuje możliwość oceny koncentracji ofert w miastach wraz z rozkładem cen w odróżnienu od innych miast, ale również dzielnic. Mapa ukazuje różnice cenowe między dzielnicami centralnymi, a obrzeżami zwanymi dzielnicami mieszkalnymi.
Mapa bąbelkowa uwidacznia drastyczne dysproporcje w średnich cenach mieszkań, gdzie dominująca wielkość i ciemny kolor bąbla nad Warszawą wyznacza ogólnokrajowy szczyt cenowy przekraczający 1 000 000 PLN. Wysoki poziom cenowy utrzymuje się również w aglomeracji krakowskiej i trójmiejskiej, podczas gdy mniejsze ośrodki, takie jak Radom czy Częstochowa, reprezentowane są przez jasne punkty sygnalizujące znacznie niższy koszt zakupu nieruchomości. Rozkład ten potwierdza, że kapitał jest silnie skoncentrowany w kilku kluczowych metropoliach, co tworzy wyraźny podział na drogie rynki regionalne i bardziej przystępne cenowo obszary reszty kraju.
Wykres słupkowy prezentuje wyraźną hierarchię cenową polskich miast, w której Warszawa deklasuje pozostałe ośrodki z rekordową średnią stawką przekraczającą 18 000 PLN za m². Drugi segment rynku tworzą Kraków oraz Gdańsk, gdzie ceny oscylują w granicach 15 000 – 17 000 PLN, podczas gdy na przeciwległym biegunie znajdują się Radom i Częstochowa z ofertami poniżej 7 500 PLN za m². Tak duża rozpiętość — sięgająca ponad 150% między stolicą a miastami o najniższych stawkach — obrazuje głębokie rozwarstwienie ekonomiczne kraju i koncentrację popytu inwestycyjnego w kilku kluczowych metropoliach.
Wykres rozrzutu z linią trendu GAM obrazuje złożoną zależność ceny za m² od odległości lokalu od centrum, podważając prosty schemat liniowego spadku wartości wraz z oddalaniem się od rdzenia miasta. Choć najwyższe stawki jednostkowe, przekraczające 25 000 PLN, koncentrują się w bezpośrednim sąsiedztwie centrum (0–2 km), linia trendu wykazuje charakterystyczne falowanie, z lokalnym wzrostem cen w okolicach 10. kilometra, co sugeruje wysoką wycenę prestiżowych dzielnic sypialnianych oraz nowoczesnych osiedli apartamentowych na obrzeżach metropolii. Ogromna chmura punktów poniżej 15 000 PLN, rozciągająca się jednostajnie wzdłuż całej osi odległości, świadczy o szerokiej dostępności lokali o niższym standardzie niezależnie od lokalizacji, podczas gdy wyraźne zwężenie rozkładu powyżej 15 km sygnalizuje ostateczny spadek stawek na terenach podmiejskich. W efekcie wykres dowodzi, że o ile ścisłe centrum generuje rekordowe ceny ofertowe, o tyle wtórne rynki lokalne i segmenty premium poza centrum skutecznie stabilizują średnią cenę za metr kwadratowy na poziomie około 15 000 PLN dla większości badanego obszaru.
Wykres przedstawiający wpływ liczby punktów usługowych (POI) na cenę metra kwadratowego wykazuje wyraźną, nieliniową zależność wzrostową, w której bogatsza infrastruktura otoczenia bezpośrednio przekłada się na wyższą wycenę nieruchomości. Linia trendu GAM sugeruje, że największy przyrost wartości następuje w przedziale od 50 do 130 punktów usługowych, gdzie cena za m² stabilizuje się na poziomie powyżej 20 000 PLN, co odzwierciedla rynkową premię za komfort życia w pełni zurbanizowanych dzielnicach. Największa koncentracja ofert (żółte i pomarańczowe pola) występuje przy niskiej liczbie punktów POI i cenach rzędu 10 000 – 15 000 PLN, natomiast spadek linii trendu powyżej 150 punktów usługowych może sygnalizować nasycenie lub specyfikę bardzo gęstych centrów miast, gdzie hałas i brak prywatności zaczynają ograniczać dalszy wzrost stawek.
Macierz korelacji Pearsona wskazuje na zróżnicowany wpływ poszczególnych zmiennych na cenę za m², przy czym najsilniejszym dodatnim czynnikiem powiązanym z wartością jednostkową nieruchomości jest liczba punktów usługowych (POI) w zasięgu, co potwierdza wysoką rynkową wycenę infrastruktury miejskiej. Co ciekawe, metraż oraz liczba pokoi wykazują słabą korelację ujemną z ceną za m², co sugeruje, że wraz ze wzrostem całkowitej powierzchni mieszkania, stawka za pojedynczy metr kwadratowy ma tendencję do lekkiego spadku. Jednocześnie obserwujemy silne, naturalne współzależności między metrażem a liczbą pokoi (0.82) oraz istotną korelację ujemną między dystansem do centrum a liczbą punktów POI (-0.45), co dowodzi, że im dalej od serca miasta, tym uboższa staje się oferta usługowa, co pośrednio rzutuje na finalną wycenę lokalu.
Powyższy moduł umożliwia dynamiczną segmentację rynku. Manipulując suwakami, można zaobserwować zjawisko elastyczności cenowej: przy zmniejszaniu odległości od centrum (< 3 km), histogram wyraźnie przesuwa się w prawo i spłaszcza, co potwierdza występowanie znacznej premii lokalizacyjnej oraz większe rozwarstwienie cen w prestiżowych dzielnicach.
Analiza przedstawionych statystyk opisowych wskazuje na znaczące zróżnicowanie rynku w badanych miastach, gdzie Warszawa, Gdańsk oraz Gdynia wyraźnie dominują pod względem najwyższych średnich wartości. Najniższe wartości średnie oraz mediany odnotowano natomiast w Radomiu i Częstochowie, co potwierdza dużą rozpiętość cenową lub wartościową pomiędzy poszczególnymi regionami. W większości analizowanych lokalizacji występuje dodatnia skośność, co oznacza przewagę wyników poniżej średniej i występowanie wartości skrajnie wysokich, szczególnie widocznych w Warszawie, gdzie maksimum sięga poziomu trzech milionów.
Pod kątem stabilności danych, najwyższy poziom rozproszenia mierzony odchyleniem standardowym oraz współczynnikiem zmienności wykazują rynki w Gdyni i Gdańsku, co sugeruje mniejszą przewidywalność cen w tych lokalizacjach w porównaniu do bardziej stabilnego Radomia czy Lublina. Rozkład wartości w większości miast charakteryzuje się również dodatnią kurtozą, wskazującą na relatywnie wysoki stopień koncentracji wyników wokół średniej, przy jednoczesnym występowaniu szerokiego rozstępu międzykwartylowego (IQR) w największych aglomeracjach. Takie zestawienie danych sugeruje, że rynki w dużych miastach wojewódzkich są nie tylko najdroższe, ale również najbardziej wewnętrznie zróżnicowane pod względem struktury oferowanych wartości.
Analiza danych wykazuje, że segment apartamentowców charakteryzuje się najwyższym prestiżem cenowym, osiągając średnią na poziomie 18 261,18 zł za metr kwadratowy oraz medianę wynoszącą 18 188,43. W porównaniu do bloków i kamienic, apartamentowce cechują się największą stabilnością cenową, co potwierdza najniższy współczynnik zmienności (odchylenie standardowe w % wynosi 0,27) oraz niemal symetryczny rozkład wartości. Z kolei kamienice, mimo niższej średniej ceny (14 533,8), wykazują największe zróżnicowanie wewnętrzne, o czym świadczy najwyższe odchylenie standardowe oraz najwyższy rozstęp międzykwartylowy (IQR) wynoszący 9819,32. Wszystkie badane kategorie posiadają dodatnią skośność, co wskazuje na przewagę ofert o cenach niższych niż średnia, przy czym najsilniejszą tendencję w tym kierunku obserwujemy w przypadku tradycyjnych bloków.
W niniejszym podrozdziale zestawiono dwa duże rynki w Polsce: stołeczną Warszawę, będącą centrum biznesowym, oraz Gdańsk, pełniący rolę kluczowego ośrodka turystycznego i portowego. Bezpośrednia analiza porównawcza pozwala oszacować “premię stołeczną” oraz zweryfikować, w jakim stopniu segmenty cenowe obu aglomeracji się pokrywają. Zbadanie różnic w rozkładach cen jest kluczowe dla oceny, czy gdański rynek premium stanowi cenową alternatywę dla standardowych inwestycji w stolicy.
Analiza wizualna ujawnia zasadnicze różnice w strukturze obu rynków. Gdańsk charakteryzuje się rozkładem o wysokiej smukłości, co oznacza dużą koncentrację ofert w wąskim przedziale cenowym między sześćset a siedemset tysięcy złotych. Rynek ten jest przez to bardziej jednorodny i przewidywalny z punktu widzenia inwestora.
W przeciwieństwie do niego Warszawa prezentuje rozkład spłaszczony z wyraźnym przesunięciem w stronę wyższych wartości, gdzie mediana oscyluje wokół ośmiuset pięćdziesięciu tysięcy złotych. Kluczową obserwacją w przypadku stolicy jest występowanie szerokiego zakresu wartości skrajnych po prawej stronie wykresu. Wskazuje to na znaczący udział segmentu luksusowego, w którym oferty przekraczające półtora miliona złotych stanowią istotną część rynku, podczas gdy w Gdańsku są one zjawiskiem marginalnym. Rynek stołeczny cechuje się zatem znacznie większym zróżnicowaniem cenowym.
Interpretacja trendów lokalizacyjnych ukazuje zasadnicze różnice w strukturze przestrzennej obu aglomeracji:
Warszawa reprezentuje model monocentryczny, w którym zależność cen od lokalizacji przybiera postać wyraźnej ujemnej korelacji liniowej. Najwyższe stawki, przekraczające dwadzieścia pięć tysięcy złotych za metr kwadratowy, skupiają się w ścisłym centrum miasta. Wraz z oddalaniem się od serca stolicy wartość nieruchomości spada w sposób niemal jednostajny, co stanowi klasyczny przykład renty lokalizacyjnej, gdzie odległość od centralnego punktu orientacyjnego jest głównym czynnikiem determinującym cenę.
Gdańsk natomiast wpisuje się w model pasmowy i policentryczny, co sprawia, że wykres cen jest znacznie bardziej złożony. W promieniu dwóch kilometrów od historycznego Śródmieścia wysokie ceny są podyktowane walorami turystycznymi oraz rynkiem najmu krótkoterminowego. Następnie, w odległości trzech do czterech kilometrów, następuje lokalny spadek cen w dzielnicach o charakterze sypialnianym, które mimo bliskości starówki nie posiadają jej prestiżu. Kolejny wzrost stawek obserwuje się w przedziale od pięciu do dziewięciu kilometrów. Wynika to ze specyfiki Centralnego Pasma Usługowego, obejmującego biznesowe ośrodki w Oliwie i Wrzeszczu, oraz atrakcyjności pasa nadmorskiego. W rezultacie w Gdańsku centrum nie stanowi pojedynczego punktu, lecz oś komunikacyjną, co powoduje, że nieruchomości położone daleko od zabytkowego rdzenia miasta mogą osiągać wyceny porównywalne z ofertami w samym Śródmieściu.
Analiza przestrzenna struktury wieku zabudowy wykorzystuje agregację heksagonalną, co pozwala na precyzyjne zbadanie rozkładu inwestycji mieszkaniowych. Przyjęcie mediany roku budowy jako głównego wskaźnika umożliwia pominięcie wpływu pojedynczych, współczesnych obiektów w starszych dzielnicach i skupienie się na dominującym charakterze architektonicznym danego rejonu.
Zestawienie to ukazuje dwa odmienne modele rozwoju aglomeracji. W Warszawie obserwujemy model monocentryczny, potocznie określany mianem efektu obwarzanka. Śródmieście oraz przyległe do niego dzielnice, takie jak Mokotów, Ochota czy Żoliborz, tworzą ciemniejszy rdzeń zdominowany przez tkankę historyczną oraz budownictwo z okresu PRL. Z kolei na obrzeżach miasta, w dzielnicach takich jak Białołęka, Ursus czy Wilanów, wyraźnie zarysowuje się jasny pierścień nowej zabudowy. Świadczy to o intensywnym procesie rozlewania się miasta i wypychaniu najnowszych inwestycji na peryferia, gdzie większa dostępność gruntów pozwala na zachowanie niższych cen.
Gdańsk prezentuje odmienny, pasmowy model rozwoju, silnie skorelowany z główną osią komunikacyjną oraz linią kolejową. Starsza zabudowa koncentruje się wzdłuż tego ciągu oraz w historycznym Śródmieściu. Ekspansja nowych inwestycji nie ma tu charakteru pierścieniowego, lecz kieruje się przede wszystkim na południe, poza linię obwodnicy, tworząc nowoczesne dzielnice sypialniane w rejonie Jasienia i Gdańska Południe. Porównanie obu miast prowadzi do wniosku, że o ile w stolicy nowe budownictwo jest tożsame z dużą odległością od centrum, o tyle w Gdańsku inwestycje te albo intensywnie uzupełniają luki w pasie nadmorskim, albo tworzą skondensowany ośrodek mieszkaniowy na południowych krańcach aglomeracji.
Przedstawione dane wskazują na systematyczny wzrost cen nieruchomości wraz z liczbą pokoi, przy czym Warszawa konsekwentnie pozostaje rynkiem droższym od Gdańska we wszystkich kategoriach. Różnice te pogłębiają się wraz z metrażem, co widać szczególnie w segmencie lokali czteropokojowych, gdzie mediana w stolicy jest o blisko 400 tys. zł wyższa niż w Gdańsku. W obu miastach występuje prawostronna asymetria rozkładu oraz rosnące rozproszenie cen w większych mieszkaniach, co sugeruje duży wpływ ofert luksusowych na średnie rynkowe, zwłaszcza w Warszawie, gdzie ceny maksymalne osiągają poziom 3 mln zł.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 820.33 < 2.2e-16 ***
## 21237
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Do sekcji 1 Typ budynku: Przeprowadzony test ANOVA (Welcha) wykazał bardzo silną istotność statystyczną (\(p < 0.001\)). Odrzucamy hipotezę zerową – rodzaj budynku jest kluczowym czynnikiem różnicującym cenę.
Ranking cenowy: Najwyższe średnie ceny osiągają apartamentowce (apartmentBuilding) (śr. ~1.13 mln PLN). Są one zdecydowanie droższe od kamienic (tenement) (śr. ~909 tys. PLN) oraz bloków (blockOfFlats), które stanowią segment najtańszy (śr. ~713 tys. PLN).Wnioski: Testy post-hoc (Gamesa-Howella) potwierdzają, że różnice między każdą parą tych grup są istotne statystycznie. Typ budynku jest jednym z najsilniejszych predyktorów ceny w badanym zbiorze.
Do sekcji 2 Piętro: Analiza wykazała istotne statystycznie różnice w cenach w zależności od kondygnacji (\(p < 0.001\)). Obserwujemy wyraźny trend rosnący:
Premia za widok: Najdroższe są mieszkania na wysokich piętrach (11+) (śr. ~961 tys. PLN).Standard: Mieszkania na piętrach niskich (1-4) i średnich (5-10) osiągają niższe wyceny (odpowiednio ~815 tys. i ~855 tys. PLN).Wniosek: Rynek premiuje mieszkania położone wysoko (panoramiczne), traktując je jako towar bardziej luksusowy, podczas gdy niższe kondygnacje w wysokiej zabudowie są wyceniane niżej.
Do sekcji 3 Dostępność usług / POI: Istnieje silna zależność między nasyceniem okolicy usługami (POI) a ceną ofertową nieruchomości (\(p < 0.001\)).Efekt lokalizacji:
Mieszkania w strefach o dużej dostępności usług są średnio o ponad 140 tys. PLN droższe (śr. ~923 tys. PLN) niż te w strefach o średniej dostępności (~781 tys. PLN).Wniosek: Bliskość szkół, restauracji i sklepów jest silnie skorelowana z wyższą ceną, co potwierdza, że lokalizacja “wszystko pod ręką” jest wysoce pożądana przez kupujących.
Do sekcji 4 Winda: Test t-Studenta (z poprawką Welcha) wskazuje na gigantyczną różnicę w cenach (\(p < 0.001\)).
Wartość udogodnienia:
Mieszkania w budynkach z windą są średnio o blisko 180 tys. PLN droższe (śr. ~914 tys. PLN) niż te bez windy (~736 tys. PLN).Kontekst: Należy pamiętać, że winda często koreluje z nowszym budownictwem (apartamentowce) lub wyższym standardem, podczas gdy brak windy jest typowy dla starszych bloków z wielkiej płyty (do 4 pięter) i kamienic, co dodatkowo pogłębia różnicę cenową.
Przeprowadzona analiza danych rynkowych z 2024 roku ujawnia obraz rynku nieruchomości cechującego się silną asymetrią prawostronną oraz wysokim progiem wejścia. Dominujący wolumen transakcyjny koncentruje się w przedziale 500 000 – 850 000 PLN, co wyznacza obecny standard cenowy dla typowego nabywcy. Rynek poniżej 250 000 PLN praktycznie przestał istnieć, co świadczy o postępującej inflacji aktywów.Istotnym zjawiskiem jest obecność segmentu luksusowego (powyżej 1,5 mln PLN), który – choć nieliczny wolumenowo – drastycznie zawyża średnią arytmetyczną cen. Z tego powodu to mediana pozostaje najbardziej rzetelnym wskaźnikiem wartości rynkowej. Obserwujemy wyraźną korelację między metrażem a ryzykiem inwestycyjnym: segment mieszkań 1- i 2-pokojowych jest stabilny i jednorodny, podczas gdy rynek lokali 3- i 4-pokojowych wykazuje ogromną dyspersję cenową, wynikającą z silnie rozwiniętego sektora premium.
struktury cenowej wg typu zabudowy (testy ANOVA) potwierdza istnienie sztywnej hierarchii prestiżu:
Apartamentowce: Lider rynku pod względem mediany cen (~1,13 mln PLN) i stabilności inwestycyjnej. To segment najdroższy, charakteryzujący się najniższym współczynnikiem zmienności.
Kamienice: Rynek o charakterze dwumodalnym i najwyższym ryzyku (największy rozstęp międzykwartylowy). Ceny są spolaryzowane między zrujnowanymi lokalami a luksusowymi rewitalizacjami.
Bloki: Najbardziej przewidywalny i przystępny cenowo segment (śr. ~713 tys. PLN), stanowiący fundament rynku masowego.
Analiza techniczna wykazała gigantyczną premię za udogodnienia: obecność windy podnosi średnią wartość mieszkania o blisko 180 000 PLN, a lokale na wysokich piętrach (11+) są wyceniane istotnie wyżej niż te na niższych kondygnacjach, co potwierdza zjawisko „premii za widok”.
Polska pozostaje rynkiem głęboko spolaryzowanym. Warszawa (śr. >18 000 PLN/m²) deklasuje pozostałe ośrodki, tworząc wraz z Trójmiastem i Krakowem grupę „rynków tier-1”. Miasta takie jak Radom czy Częstochowa, z cenami poniżej 7 500 PLN/m², stanowią odrębny biegun ekonomiczny.
Szczegółowa analiza porównawcza Warszawy i Gdańska ujawniła dwa odmienne modele urbanistyczne:
Warszawa (Model Monocentryczny):Występuje tu klasyczna renta lokalizacyjna – cena spada liniowo wraz z oddalaniem się od Pałacu Kultury. Nowe inwestycje są wypychane na peryferia („efekt obwarzanka”), tworząc jasny pierścień nowej zabudowy wokół ciemniejszego, historycznego rdzenia.
Gdańsk (Model Policentryczny/Pasmowy): Ceny nie spadają liniowo.Nowa zabudowa nie otacza miasta, lecz ekspanduje na południe oraz wypełnia luki w pasie nadmorskim.
Analiza korelacji wskazuje, że dostępność usług (Points of Interest) jest najsilniejszym pozytywnym predyktorem ceny za m². Zależność ta nie jest jednak liniowa – rynek najlepiej wycenia lokalizacje z 50–130 punktami usługowymi w zasięgu (cena >20 000 PLN/m²). Powyżej tej liczby (ścisłe, głośne centra) wzrost cen wyhamowuje. Potwierdza to tezę, że nabywcy szukają kompromisu między dostępnością usług a komfortem życia.
Przeprowadzone testy parametryczne (Welch ANOVA, Games-Howell) na próbie ponad 20 tys. ofert pozwoliły na sformułowanie wniosków o wysokim poziomie istotności statystycznej (\(p < 0.001\)):
Typ budynku jest kluczowym dyskryminatorem ceny (apartamentowiec > kamienica > blok).
Lokalizacja wertykalna ma znaczenie: najwyższe piętra są towarem luksusowym, partery i niskie piętra są wyceniane niżej.
Infrastruktura bezpośrednio przekłada się na wartość: strefy o wysokim nasyceniu POI są średnio o 140 000 PLN droższe od stref o nasyceniu średnim.
Konkluzja: Rynek w 2024 roku jest rynkiem dojrzałym, ale silnie rozwarstwionym. Najbezpieczniejszymi aktywami są małe i średnie lokale w apartamentowcach oraz nieruchomości w dobrze skomunikowanych dzielnicach Gdańska i Warszawy. Inwestycje w duże metraże (>4 pokoje) oraz kamienice obarczone są znacznie wyższym ryzykiem zmienności cenowej.